1,569 research outputs found

    A systematic review of data quality issues in knowledge discovery tasks

    Get PDF
    Hay un gran crecimiento en el volumen de datos porque las organizaciones capturan permanentemente la cantidad colectiva de datos para lograr un mejor proceso de toma de decisiones. El desafío mas fundamental es la exploración de los grandes volúmenes de datos y la extracción de conocimiento útil para futuras acciones por medio de tareas para el descubrimiento del conocimiento; sin embargo, muchos datos presentan mala calidad. Presentamos una revisión sistemática de los asuntos de calidad de datos en las áreas del descubrimiento de conocimiento y un estudio de caso aplicado a la enfermedad agrícola conocida como la roya del café.Large volume of data is growing because the organizations are continuously capturing the collective amount of data for better decision-making process. The most fundamental challenge is to explore the large volumes of data and extract useful knowledge for future actions through knowledge discovery tasks, nevertheless many data has poor quality. We presented a systematic review of the data quality issues in knowledge discovery tasks and a case study applied to agricultural disease named coffee rust

    Mejorando los sistemas rurales de alertas tempranas a través de la integración de OpenBTS y JAIN SLEE

    Get PDF
    Actualmente existe una tendencia que combina las características de los servicios Web 2.0 y los servicios de telecomunicaciones, conocida como Telco 2.0. Estos servicios convergentes se han aplicado exitosamente en sistemas de alertas tempranas, proporcionando mayor agilidad y flexibilidad en la prestación de servicios. Sin embargo, existen varias limitantes que no permiten el despliegue de servicios convergentes en las zonas rurales de países en vía de desarrollo, como la falta de disponibilidad de una ngn (Next Generation Network), la ausencia de tecnología avanzada y la falta de recursos para inversión. Este artículo propone una arquitectura de integración entre jain slee y OpenBTS para sistemas rurales de alertas tempranas. Se evalúa el prototipo implementado con un caso de estudio específico al enviar advertencias Telco 2.0 a los cafeteros colombianos cuyas plantaciones puedan verse afectadas por la roya, una de las enfermedades más peligrosas para la producción de café.Nowadays exists a trend that combines the features of Web 2.0 services and telecommunications services known as Telco 2.0. These converged services have been successfully implemented in early warning systems providing improved agility and flexibility in service delivery. However the deployment of converged services in rural zones of developing countries presents several constraints which do not allow to provide this kind of services, as the unavailability of a Next Generation Network (ngn), absence of advanced technology and lack of investment resources. This paper proposes a jain slee and OpenBTS integration architecture for early warning systems in rural zones. The implemented prototype is evaluated with a specific case study involving the deployment of Telco 2.0 warnings in Colombian coffee plantations which may be affected by coffee rust, one of the most threatening diseases in coffee production

    Expert System for Crop Disease based on Graph Pattern Matching: A proposal

    Get PDF
    Para la agroindustria, las enfermedades en cultivos constituyen uno de los problemas más frecuentes que generan grandes pérdidas económicas y baja calidad en la producción. Por otro lado, desde las ciencias de la computación, han surgido diferentes herramientas cuya finalidad es mejorar la prevención y el tratamiento de estas enfermedades. En este sentido, investigaciones recientes proponen el desarrollo de sistemas expertos para resolver este problema haciendo uso de técnicas de minería de datos e inteligencia artificial, como inferencia basada en reglas, árboles de decisión, redes bayesianas, entre otras. Además, los grafos pueden ser usados para el almacenamiento de los diferentes tipos de variables que se encuentran presentes en un ambiente de cultivos, permitiendo la aplicación de técnicas de minería de datos en grafos, como el emparejamiento de patrones en los mismos. En este artículo presentamos una visión general de las temáticas mencionadas y una propuesta de un sistema experto para enfermedades en cultivos, basado en emparejamiento de patrones en grafos.For agroindustry, crop diseases constitute one of the most common problems that generate large economic losses and low production quality. On the other hand, from computer science, several tools have emerged in order to improve the prevention and treatment of these diseases. In this sense, recent research proposes the development of expert systems to solve this problem, making use of data mining and artificial intelligence techniques like rule-based inference, decision trees, Bayesian network, among others. Furthermore, graphs can be used for storage of different types of variables that are present in an environment of crops, allowing the application of graph data mining techniques like graph pattern matching. Therefore, in this paper we present an overview of the above issues and a proposal of an expert system for crop disease based on graph pattern matching

    Directrices para proveedores de contenido del espacio de información OpenAIRE

    Get PDF
    11 p.Documento electrónicoLas Directrices OpenAIRE 1.0, orientarán a los administradores de repositorios para definir e implementar sus políticas locales de administración de datos cumpliendo con las demandas de la Comisión Europea sobre Acceso Abierto. Además, cumplirán con los requisitos técnicos de la infraestructura de OpenAIRE, diseñada para soportar y monitorizar la implementación del piloto 7PM OA1.Contenido Introducción Agradecimientos y Colaboradores Editores Expertos y Revisores Relación con las directrices de DRIVER Set OpenAIRE Nomenclatura del set OpenAIRE Definiciones del contenido del set OpenAIRE Uso del oai_dc en OpenAIRE Uso de los tres elementos específicos de OpenAIRE Todos los elementos: breve descripciónTraducción : Eloy Rodrigues (Universidade do Minho,Portugal

    Un enfoque multinivel para la recuperación de procesos de negocio

    Get PDF
    Nowadays business process reuse is critical in companies that need to build flexible and service-based business solutions in order to react quic­kly and cost-effective to dynamic market-conditions. For this reason, many companies have implemented approaches to find relevant business processes to be reused to create new software solutions performing re­quired business functionalities. This paper presents a multilevel retrieval approach that detects linguistic, structural, and behavioral properties to increase the precision level in recovering those business processes stored in a repository.Actualmente reutilizar procesos de negocio es un procedimiento crítico especialmente para compañías que requieren construir soluciones flexibles y soportadas por servicios con el fin de afrontar de manera efectiva y a bajo costo las condiciones cambiantes del mercado. Por esta razón, muchas de ellas han implementado métodos para encontrar procesos de negocio relevantes que puedan ser reutilizados en la creación de nuevas soluciones software que cumplan con una determinada función de negocio. Este artí­culo presenta un método multinivel que detecta similitudes entre procesos de negocio, teniendo en cuenta propiedades lingüísticas, estructurales y de comportamiento, con el fin de incrementar el nivel de precisión en la recuperación de aquellos procesos existentes en un repositorio

    A multi level approach for business process retrieval

    Get PDF
    Nowadays business process reuse is critical in companies that need to build flexible and service-based business solutions in order to react quic­kly and cost-effective to dynamic market-conditions. For this reason, many companies have implemented approaches to find relevant business processes to be reused to create new software solutions performing re­quired business functionalities. This paper presents a multilevel retrieval approach that detects linguistic, structural, and behavioral properties to increase the precision level in recovering those business processes stored in a repository.Actualmente reutilizar procesos de negocio es un procedimiento crítico especialmente para compañías que requieren construir soluciones flexibles y soportadas por servicios con el fin de afrontar de manera efectiva y a bajo costo las condiciones cambiantes del mercado. Por esta razón, muchas de ellas han implementado métodos para encontrar procesos de negocio relevantes que puedan ser reutilizados en la creación de nuevas soluciones software que cumplan con una determinada función de negocio. Este artí­culo presenta un método multinivel que detecta similitudes entre procesos de negocio, teniendo en cuenta propiedades lingüísticas, estructurales y de comportamiento, con el fin de incrementar el nivel de precisión en la recuperación de aquellos procesos existentes en un repositorio

    Anatomical distribution of subcutaneous fat and its relationship with body condition score in pack mules from the central andean area of colombia.

    Get PDF
    Introducción: en las zonas andinas de montaña colombiana las mulas son la base para el desarrollo de actividades agrícolas de económicas campesinas. En el manejo de las mulas predomina el conocimiento empírico de los campesinos para el aspecto nutricional, que implican tener animales en condición corporal óptima para el trabajo de carga. Uno de los aspectos importantes de manejo relacionado con el bienestar animal es la determinación de la condición corporal (nivel de engrasamiento), la cual puede ser calculada por medio de técnicas subjetivas (visuales) y objetivas como la medición del espesor de grasa por ultrasonido. Objetivos: El objetivo del estudio fue determinar el engrasamiento en diferentes regiones anatómicas corporales y su relación con el puntaje de condición corporal (PCC) en mulas de trabajo. Métodos: Se midieron mulares con edades entre 5 y 30 años, de 4 municipios del occidente de Cundinamarca (n=42). En cada ejemplar se midió el PCC escala (1-9) de forma visual y el espesor de grasa subcutánea usando ultrasonido en 5 sitios anatómicos (dorsal - EGD, lumbar - EGL, cincha - EGC, cruz - EGCR y anca - EGA). Resultados: El PCC promedio en las mulas fue de 5,2±1,1 y los promedios de espesor de grasa subcutánea encontrados para las regiones EGD, EGL, EGC, EGCR y EGA fueron 5,2±2,1 mm, 3,9±0,8 mm, 7,0±2,2 mm, 4,7±1,5 y 4,2±1,2 mm, respectivamente. Se encontraron correlaciones moderadas entre PCC y EGD (r=0,39; p<0,01 Conclusiones: Se concluye que la distribución del engrasamiento subcutáneo es diferente para los 5 sitios anatómicos evaluados, evidenciando un mayor engrasamiento en la región de la cincha seguida por la región dorsal.Introduction: In the Colombian Andean mountain areas, mules are the basis for the development of agricultural activities of smallholders. In the management of mules, the empirical knowledge of farmers predominates for the nutritional aspect, which implies having the animals in optimal body condition for the task of pack loading. One of the important aspects of management related to animal welfare is the determination of body condition (level of fatness), which is calculated via subjective (visual) and objective techniques such as real-time ultrasound fat thickness measurement. Aims: The aim of the present study was to determine the fatness using ultrasound in different anatomical regions of the body and its association with body condition scores (BCSs) in working mules. Methods: Mules (n = 43) aged 5–30 years, from four municipalities in the western area of Cundinamarca, were measured in each sample. Mules were assigned a BCS value (1–9) based on visual appraisal and palpation of the dorsal and lumbar areas, area behind the shoulder, withers, and tail head as well as by measuring the subcutaneous fat thickness using ultrasound in five anatomical sites [back fat thickness (BFT), loin fat thickness (LFT), hearth fat thickness (HFT), wither fat thickness (WFT), and hip fat thickness (FHT)]. Results: The mean BCS in the mules was 5.2 ± 1.1 and the mean subcutaneous fat thickness for the sites BFT, LFT, HFT, WFT, and FHT were 5.2 ± 2.1 mm, 3.9 ± 0.8 mm, 7.0 ± 2.2 mm, 4.7 ± 1.5, and 4.2 ± 1.2 mm, respectively. Correlation coefficient between BCS and BFT was r = 0.39 (p <0.01), that between BCS and HFT was 0.49 (p ><0.01), and that between BCS and HFT was r = 0.43 (p >< 0.01). Conclusion: We concluded that the distribution of subcutaneous fatness is different for the five anatomical sites evaluated, demonstrating a greater fatness in the hearth region followed by the back region

    A case-based reasoning system for recommendation of data cleaning algorithms in classification and regression tasks

    Get PDF
    Recently, advances in Information Technologies (social networks, mobile applications, Internet of Things, etc.) generate a deluge of digital data; but to convert these data into useful information for business decisions is a growing challenge. Exploiting the massive amount of data through knowledge discovery (KD) process includes identifying valid, novel, potentially useful and understandable patterns from a huge volume of data. However, to prepare the data is a non-trivial refinement task that requires technical expertise in methods and algorithms for data cleaning. Consequently, the use of a suitable data analysis technique is a headache for inexpert users. To address these problems, we propose a case-based reasoning system (CBR) to recommend data cleaning algorithms for classification and regression tasks. In our approach, we represent the problem space by the meta-features of the dataset, its attributes, and the target variable. The solution space contains the algorithms of data cleaning used for each dataset. We represent the cases through a Data Cleaning Ontology. The case retrieval mechanism is composed of a filter and similarity phases. In the first phase, we defined two filter approaches based on clustering and quartile analysis. These filters retrieve a reduced number of relevant cases. The second phase computes a ranking of the retrieved cases by filter approaches, and it scores a similarity between a new case and the retrieved cases. The retrieval mechanism proposed was evaluated through a set of judges. The panel of judges scores the similarity between a query case against all cases of the case-base (ground truth). The results of the retrieval mechanism reach an average precision on judges ranking of 94.5% in top 3, for top 7 84.55%, while in top 10 78.35%.The authors are grateful to the research groups: Control Learning Systems Optimization Group (CAOS) of the Carlos III University of Madrid and Telematics Engineering Group (GIT) of the University of Cauca for the technical support. In addition, the authors are grateful to COLCIENCIAS for PhD scholarship granted to PhD. David Camilo Corrales. This work has been also supported by: Project Alternativas Innovadoras de Agricultura Inteligente para sistemas productivos agrícolas del departamento del Cauca soportado en entornos de IoT financed by Convocatoria 04C-2018 Banco de Proyectos Conjuntos UEES-Sostenibilidad of Project Red de formación de talento humano para la innovación social y productiva en el Departamento del Cauca InnovAcción Cauca, ID-3848. The Spanish Ministry of Economy, Industry and Competitiveness (Projects TRA2015-63708-R and TRA2016-78886-C3-1-R)
    corecore